技術問答
技術文章
iT 徵才
Tag
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
3
0
AI & Data
YOLO系列網路技術採用以及實作
系列 第
3
篇
[DAY 3] YOLOv2
15th鐵人賽
Xian
2023-09-18 16:00:22
720 瀏覽
分享至
YOLO9000: Better, Faster, Stronger
Joseph Redmon, Ali Farhadi
可偵測超過9000種類別
問題
過去方法只能辨識很少的類別物件。
替影像作detection標註比做classification標註更耗時。
跟Region proposal based的方法相比,YOLOv1 recall較低。
要提升準確度往往需要提高網路複雜度。
方法:
Better
Batch Normalization
: 取代Dropout,加快收斂且
提升2% mAP
。
High Resolution Classifier
: 先用448×448像素值的影像預先進行訓練10個epochs,先
提升4% mAP
。
Anchor Boxes
:
移除全連結層,並用Anchor Boxes預測Bounding Boxes。
輸入為416×416為了讓特徵圖中的座標為奇數個,這樣中心點座標就會唯一。mAP會下降,但是提升了Recall。
Dimension Clusters
:過去需手動設定Anchor Box數量以及尺寸,但本文利用K-means去生成Bounding Box,可以使得模型學得更好。
K-mean用:
最終求得:
K=5
,Recall跟模型複雜度較為適合。
Direct location prediction
: 每個Grid Cell預測五個Bounding Box,
並且有五個值
bx,by:預測的Bounding Box中心點位置+距離最左邊跟最上面Grid Cell的格數。
bw,bh:預測的Bounding Box寬跟高乘上寬跟高篇移量的exponential結果。
信心度值會再經過sigmoid後輸出
Fine-Grained Features
:串接較為淺層的特徵到深層網路當中,提升1%。
Multi-Scale Training
:為了讓模型可以處理不同大小的影像,每10個batch會重新選擇一個新的影像大小{320,352, ...,608}
Faster
物件偵測網路常採用VGG-16用於特徵提取,但是因為VGG-16參數量太大,YOLOv2提出一個新的分類模型: Darknet-19。
Darknet-19
: 19個convolution layers,5個max pooling layers,參數量少很多。
Stronger
當將兩個Dataset進行合併的時候可能會遇到類別互斥問題,舉論文例子:對於一張狗的影像,有的資料集標得是"狗",有的資料集標的是狗的品種。
建立
Hierarchical Wordtree
:
可藉由路徑上的節點機率來得到對應類別的機率,其中phisical object代表影像中是否有物件存在。
模型訓練
Classification:會先用分類網路預訓練10個epochs訓練448×448的影像,並接續訓練160個epochs。
Detection: 移除上面預訓練好的classification模型最後一層convolution層,並添加三層3×3×1024的卷積層,以及最後加入一層輸出層(1×1×(5 boxes × (5 coordinates +類別數))),中間有加入passthorough層。
實驗結果
文章使用之圖片擷取自該篇論文
留言
追蹤
檢舉
上一篇
[DAY 2] YOLO的開端-YOLOv1
下一篇
[DAY 4] YOLOv3
系列文
YOLO系列網路技術採用以及實作
共
30
篇
目錄
RSS系列文
訂閱系列文
10
人訂閱
26
[DAY 26] YOLOv8模型訓練
27
[DAY 27] 訓練資料前處理(補充)
28
[DAY 28] 訓練資料擴充(補充)
29
[DAY 29] 模型訓練結果
30
[DAY 30] 完賽心得
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19838
篇
完賽人數
529
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
可以自訂規則的密碼產生器....
網路電話VoIP Gateway被駭客盜打的問題??? 網路電話:Mini voip router 福憶電子
Windows更新像跑馬燈以致無法進入桌面
還能怎麼加固安全?
FortiGate 的VLAN Switch問題
爬蟲問題, 如何在GOOGLE搜尋關鍵字後,取前10頁的網址?
內控內稽的作業流程圖.請問哪裡有設備工程業的
源碼檢測稽核會不會超耗時
WIN SERVER 出現錯誤LOG
你們都在哪裡購買SSL
熱門回答
網路電話VoIP Gateway被駭客盜打的問題??? 網路電話:Mini voip router 福憶電子
可以自訂規則的密碼產生器....
源碼檢測稽核會不會超耗時
你們都在哪裡購買SSL
FortiGate 的VLAN Switch問題
熱門文章
讀書會邀請: AWS 雲端攻頂學習計畫|SAA 基礎 + SAP/DevOps 分流 從理論到企業級部署,每週一次的架構思維演練
[實作] 不用買貴森森的 Vector!我用 Python 自製了一套 J1939 CAN Bus 解碼器
Git 版本控制指令
Microsoft MS-900 認證考試介紹|Microsoft 365 Fundamentals 完整指南(2025 最新)
Git版本控制三個工作流程,工作目錄、暫存區、本地倉庫。
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}